Lịch sử của khoa học thống kê Thống_kê

Blaise Pascal, một nhà tiên phong về các môn toán xác suất.

Phương pháp thống kê đã tồn tại ít nhất là thế kỷ thứ 5 trước công nguyên.

Một số học giả xác định được nguồn gốc của số liệu thống kê đến năm 1663, với các ấn phẩm của tự nhiên và quan sát chính trị Bills do John Graunt. Ứng dụng đầu tiên của thống kê xoay quanh nhu cầu chính sách các quốc gia trên cơ sở dữ liệu nhân khẩu học và kinh tế, do đó hình thành ngành nghiên cứu nguồn gốc thống kê. Phạm vi của các môn học thống kê mở rộng trong những năm đầu thế kỷ 19 bao gồm việc thu thập và phân tích dữ liệu nhưng không chuyên sâu. Ngày nay, thống kê được sử dụng rộng rãi hơn trong chính phủ, kinh doanh, khoa học tự nhiên và xã hội.Cơ sở hình thành toán học đã được đưa ra vào thế kỷ 17 với sự phát triển lý thuyết xác suất của Blaise Pascal và Pierre de Fermat. Lý thuyết xác suất toán xuất phát từ việc nghiên cứu trò chơi may rủi, mặc dù khái niệm xác suất đã được nghiên cứu trong thời trung cổ và luật của các triết gia như Juan Caramuel.[24] Các phương pháp bình phương nhỏ nhất đã được mô tả đầu tiên bởi Adrien-Mrie Legendre vào năm 1805.

Karl Pearson, the founder of mathematical statistics.

Các lĩnh vực hiện đại của số liệu thống kê xuất hiện vào cuối thế kỷ 19 và đầu thế kỷ 20 trong 3 giai đoạn.[25] Giai đoạn đầu tiên, vào thời điểm chuyển giao thế kỷ, được dẫn dắt bởi các công việc của Sir Francis Galton và Karl Pearson, đã trở thành một hệ thống thống kê toán học sử dụng trong phân tích, không chỉ trong các nghiên cứu khoa học, mà còn sử dụng trong các ngành công nghiệp và chính trị. Sự đóng góp của Galton trong lĩnh vực này bao gồm giới thiệu các khái niệm về độ lệch chuẩn, tương quan, hồi quy và các ứng dụng của các phương pháp này để nghiên cứu về đặc điểm của con người, chiều cao, cân nặng, chiều dài của lông mi và các đặc điểm khác.[26] Pearson phát triền các hệ số tương quan, được định nghĩa như là tích số quan trọng[27]. Phương pháp của hiện tại cho việc điều chỉnh phân phối màu và hệ thống các đường cong liên tục, trong số những mẫu khác[28]. Galton và Pearson thành lập Biometrika là cuốn sách đầu tiên của thống kê toán và sinh học, thành lập ban thống kê đầu tiên tại trường đại học London.[29]

Giai đoạn thứ hai của những năm 1910 và 1920 đã được khởi xướng bởi William Gosset, và đỉnh cao trong tri thức của Sir Ronald Fisher, người đã viết cuốn sách để xác định các ngành học trong các trường đại học trên toàn thế giới. Ấn phẩm quan trọng nhất của Fissher là 1916 trang, các tương quan giữa mối liên hệ với giả thuyết, kế thừa của Mendelian và 1925 cách sử dụng phương pháp thống kê cho những nhà nghiên cứu. Bài viết của ông là người đầu tiên sử dụng các thuật ngữ thống kê, phương sai. Ông đã phát triển mô hình thử nghiệm nghiêm ngặt và cũng hệ thống đầy đủ dữ liệu, thống kê phụ thuộc, phân biệt tuyến tính của Fisher và thông tin Fisher.[30]

Giai đoạn cuối cùng, trong đó chủ yếu là nhận thấy sự tinh tế và mở rộng phát triển trước đó, nổi lên từ sự hợp tác giữa Egon Pearson và Jerzy Neyman trong năm 1930. Họ giới thiệu các khái niệm về sai số “loại II”, sức mạnh của một thử nghiệm và khoảng thời gian tin cậy. Năm 1934, Jerzy Neyman cho thấy việc chọn mẫu ngẫu nhiên phân lớp là một phương pháp tốt hơn của ước lượng so với chọn mẫu có mục đích.[31]

Ngày nay phương pháp thống kê được áp dụng trong tất cả các lĩnh vực có liên quan đến việc ra quyết định, để cho các kết luận chính xác từ một bộ phận so với các dữ liệu và đưa ra quyết định khi đối mặt với kết luận không chắc chắn dựa trên phương pháp thống kê. Việc sử dụng máy tính hiện đại đã tính toán nhanh các tính toán thống kê quy mô lớn, và cũng đã có những phương pháp mới có thể không chính xác bằng việc tính bằng tay. Thống kê tiếp tục là một lĩnh vực nghiên cứu thiết thực, ví dụ như vấn đề làm sao để phân tích dữ liệu lớn.[32]